標簽【open idea】 - 碼上歡樂

LQR和iLQR、DDP

LQR直接通過backward和forward 過程給出最控制率和軌跡，而iLQR初始化一條軌跡，然后用LQR動態優化這條軌跡，直到找到最優解； LQR是在環境線性化模型、cost function ...